llm

元数据和微调为何是将NLQ扩展到SQL的关键

大量数据以结构化数据的形式存储在数十万个组织中。数百万的商业用户每天都使用这些结构化数据来运营业务,从中获得可以帮助改进业务运营的见解。存储这些结构化数据最流行的方式是使用 MySQL。其他流行的关系数据库包括 PostgreSQL、Microsoft SQL

llm sql nlq 2024-12-23 21:15  20

如何优化大型语言模型(LLM)的分块策略

大型语言模型(LLM)通过其生成类似人类水平的文本、解答复杂问题的能力以及对大量信息进行分析所展现出的惊人准确性,已经改变了自然语言处理(NLP)领域。从客户服务到医学研究,LLM在处理各种查询并生成详细回复的能力使它们在许多领域都具有不可估量的价值。然而,随

模型 策略 llm 2024-12-23 15:01  21

苹果和英伟达合作新的推测解码方法,可将文本生成速度提升2.7倍

众所周知,对于自回归模型而言,内存带宽一直是制约推理性能的关键瓶颈。当模型生成文本时,它需要反复执行前向传播来预测每个 token,这个过程不仅需要大量的计算资源,更重要的是会频繁访问内存来获取模型权重和中间状态。这种内存密集型的特性导致了较高的延迟,影响用户

苹果 英伟达 llm 2024-12-21 18:37  19

停止支付OpenAI税:新兴的开源AI技术栈

如果我们能够回到过去,告诉软件工程师他们的应用程序将由神秘的AI驱动,我们对其内部运作一无所知,并且他们为了体验的便利性而将最敏感的数据交给影子第三方,他们可能会难以置信地摇头。但这就是我们现在所处的境地。

开源 openai llm 2024-12-21 16:33  19

博弈论LLM:智能体博弈能力升级策略丨周日分享·大语言模型与多智能体系统读书会

大语言模型遭遇囚徒困境时,会如何决策?目前人工智能在面对复杂决策,特别是涉及到与其他智能体的互动时,依然存在很大的局限性。即使是最先进的大型语言模型(LLM)在处理这些博弈时也面临着计算纳什均衡的挑战,在面对不确定性和噪声时仍存在鲁棒性问题。

智能体 llm 多智能体 2024-12-20 20:59  22

(转载)综述:基于LLM的数据查询与可视化

这是一篇关于自然语言在表格数据查询和可视化方面的综述。该综述全面概述如何通过自然语言实现表格数据查询和可视化,使用户能够使用自然语言查询与数据进行交互。介绍了可视化背后的基本概念和技术,特别强调了语义解析这一关键技术,它有助于将自然语言转换为 SQL 查询并实

可视化 llm sql 2024-12-17 14:46  18

LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqiz

meta llm uc 2024-12-17 21:37  18

本地构建Llama 3.2-Vision多模态LLM聊天应用实战

视觉功能与大型语言模型(LLM)的集成正在通过多模态LLM(MLLM)彻底改变计算机视觉领域。这些模型结合了文本和视觉输入,在图像理解和推理方面表现出令人印象深刻的能力。虽然这些模型以前只能通过API访问,但是最近发布的一些开源项目已经支持在本地执行,这使得它

模态 llm llama 2024-12-17 08:18  19

Google新出AI学习神器,推演LLM应用的终极形态

NotebookLM 是由 Google I/O Tailwind项目演变而来,并且集成了 “音频概览(本文使用播客指代)”功能。该功能可以将用户上传的各种格式的文档(包括文本、PDF 和音频)转换为生动有趣的音频播客。新颖的功能吸引了大量用户,并在海外社交媒

llm google 推演llm 2024-12-16 18:34  24

让AI“开口说话”:复杂模型的解释不再晦涩

机器学习模型虽然功能强大,但可能会出错,并且通常难以使用。为了帮助用户了解何时以及如何信任模型的预测,科学家们开发了各种解释方法。然而,这些解释往往十分复杂,可能涉及数百个模型特征,有时还以多层次的可视化形式呈现,这让缺乏机器学习背景的用户难以完全理解。

说话 模型 llm 2024-12-16 17:30  18